¿Quién anota en PLN? Evaluación masiva de informes de anotación humana (2018-2025)
Descubre cómo se documentan las anotaciones humanas en investigaciones de PLN entre 2018 y 2025, y qué aspectos clave suelen omitirse.
Descubre cómo se documentan las anotaciones humanas en investigaciones de PLN entre 2018 y 2025, y qué aspectos clave suelen omitirse.
Descubre TukaBench, el primer benchmark cultural de jailbreak para lenguas africanas. Evalúa la seguridad de LLMs y la confiabilidad de los jueces automáticos.